#benchmark mmlu

Compresión de LLM eliminando bloques con optimización binaria

Descubre cómo comprimir modelos de lenguaje eliminando bloques con optimización binaria. Logra un 23% más en MMLU al 50% de compresión. Eficiente y general.

2026-06-18 · 1 min